ارائه یک روش ترکیبی توصیف و مقایسه کلمات برای کاربرد بازیابی مستندات فارسی

پایان نامه
چکیده

هدف از این پایان نامه ارائه یک روش برای تشخیص کلمات دست نویس فارسی می باشد. کانتور کلمات دست نویس جهت استخراج ویژگی ها و تبدیل تطبیق تصویر کلمات به تطبیق رشته ای از ویژگی ها مورد استفاده قرار گرفته است.در اینجا علاوه بر ویژگی های مکانی، از ویژگی های فرکانسی نیز بهره گرفته ایم. جهت کاهش دامنه جستجو از الگوریتم k-نزدیکترین همسایه با فاصله اقلیدسی استفاده شده است.سپس از الگوریتم تطبیق رشته جهت تطبیق ویژگی های بدست آمده که شامل ویژگی های استخراج شده از مرز بدنه کلمات و ویژگی های فرکانسی است, استفاده می شود. دقت بدست آمده در این پایان نامه 86% در پنج انتخاب و74.1% در انتخاب درست کلمه است.

منابع مشابه

ارائه روشی برای استخراج کلمات کلیدی و وزن‌دهی کلمات برای بهبود طبقه‌بندی متون فارسی

Due to ever-increasing information expansion and existing huge amount of unstructured documents, usage of keywords plays a very important role in information retrieval. Because of a manually-extraction of keywords faces various challenges, their automated extraction seems inevitable. In this research, it has been tried to use a thesaurus, (a structured word-net) to automatically extract them. A...

متن کامل

ارائه روشی جدید برای شاخص‌گذاری خودکار و استخراج کلمات کلیدی برای بازیابی اطلاعات و خوشه‌بندی متون

Persian words in writing with a diverse and cover all modes of grammatical words with the recruitment of a series of specific rules because it is impossible to extract keywords automatically from Persian texts difficult and complex. This thesis has attempted to use linguistic information and thesaurus, keywords Mnatry be provided. Using the symbol system is structured network can be keywords, i...

متن کامل

ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب

جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (OCR) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح می‌گردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده‌ بندی مبتنی بر خصیصه (Attribute-based Cla...

متن کامل

یک روش دو مرحلهای برای بازشناسی کلمات دستنوشته فارسی به کمک بلوکبندی تطبیقی گرادیان تصویر

This paper presented a two step method for offline handwritten Farsi word recognition. In first step, in order to improve the recognition accuracy and speed, an algorithm proposed for initial eliminating lexicon entries unlikely to match the input image. For lexicon reduction, the words of lexicon are clustered using ISOCLUS and Hierarchal clustering algorithm. Clustering is based on the featur...

متن کامل

بازیابی مستندات قرآنی مسأله تفویض

مقاله حاضر با هدف بررسی مستندات قرآنی تفویض به معنای واگذاری امور به دیگران به رشته تحریر در آمده است. جهت یافتن مستندات قرآنی، افزون بر جست‌وجوی آیات از قرآن، از دیگر منابع حدیثی و کلامی هم استفاده شده است. یافته‌های تحقیق نشان می‌دهد که در آیات قرآن برخی امور به ملائکه نسبت داده شده است از جمله: میراندن و قبض روح، تدبیر نظام هستی، تقسیم امور، اعطای فرزند به حضرت مریم و همچنی...

متن کامل

ارائه خصیصه های خاص زبان فارسی جهت بازیابی و بازشناسی کلمات تصویری فارسی با استفاده از تعبیه برچسب

جستجو و بازیابی کلمات دستنویس در اسناد تصویری روشی جایگزین برای بازشناسی کاراکترهای نوری (ocr) است. این راهکار بیشتر در مواردی که بازشناسی کاراکترهای نوری دقت پایینی دارند، مانند متون دستنویس یا متون چاپی با کیفیت پایینی مطرح می گردد. امروزه یکی از روشهای کارآمد در بازیابی مبتنی بر محتوای تصویر، که برای کلمات تصویری هم توسعه داده شده است، استفاده از رده بندی مبتنی بر خصیصه (attribute-based clas...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سمنان - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023